민감도와 특이도

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 정의
- 2.1. 민감도 (Sensitivity, True Positive Rate, Recall)
- 2.2. 특이도 (Specificity, True Negative Rate)
3. 선별 검사(Screening Study)에의 적용
- 3.1. 진단 기준 설정과 민감도/특이도의 상충 관계 (Trade-off)
4. 오해와 한계
5. 정보 검색에서의 용어
6. 관련 통계 지표
7. 추가 자료
참조

1. 개요

민감도와 특이도는 의학적 진단 및 정보 검색 분야에서 사용되는 통계 지표로, 검사의 정확성을 평가하는 데 활용된다. 민감도는 실제 양성인 대상 중 검사 결과가 양성으로 나타나는 비율을 의미하며, 질병이 있는 사람을 얼마나 잘 찾아내는지를 나타낸다. 특이도는 실제로 음성인 대상 중에서 검사 결과가 음성으로 나타나는 비율로, 질병이 없는 사람을 얼마나 정확하게 음성으로 판정하는지를 보여준다. 선별 검사에서는 민감도와 특이도를 모두 높여 질병을 정확하게 진단하는 것이 목표이다. 하지만 진단 기준 설정에 따라 민감도와 특이도는 상충 관계를 가지며, 검사의 목적, 질병 유병률 등을 고려하여 최적의 기준을 결정해야 한다. 한국에서는 감염병 진단 분야에서 민감도와 특이도가 중요한 지표로 활용되며, 코로나19 팬데믹 상황에서 진단 키트의 성능 평가 및 방역 정책 수립에 활용되었다.

더 읽어볼만한 페이지

정확도와 정밀도 - 교정 (공학)
교정(공학)은 측정 장비의 정확성을 확보하고 측정 결과를 국가 표준에 부합하도록 보장하는 과정으로, 국제도량형국은 이를 측정 표준과 교정 대상 기기 간의 관계 설정 및 측정 불확도 고려 과정으로 정의하며, 제품 및 서비스 품질 향상과 법규 준수를 위해 요구되고, 한국에서는 국가기술표준원이 관련 업무를 총괄하며 특정 분야에서는 기기의 정확한 표시를 위한 조정 과정도 포함한다.
정확도와 정밀도 - 관측 오차
관측 오차는 과학 실험이나 설문 조사에서 측정값과 실제값의 차이를 나타내며 무작위성과 확률론으로 모델링되는 불확실성을 포함하고, 무작위 오차와 체계적 오차, 그리고 설문조사에서 발생하는 비표본 오차 등으로 구분된다.
생물통계학 - 역학 (의학)
역학은 인구 집단의 질병, 건강 상태 및 관련 요인의 분포와 원인을 연구하여 건강 문제를 통제하는 학문으로, 고대 히포크라테스 시대부터 시작되어 존 스노우에 의해 근대적 학문으로 발전했으며 분자 역학, 전장 유전체 연관성 연구를 거쳐 분자 병리 역학, 디지털 역학으로 확장되고 질병의 인과 관계를 추론하고 공중 보건 정책 수립에 기여한다.
생물통계학 - 기준선 이동
기준선 이동은 세대가 발전하며 과거 자연 변화에 대한 지식이 잊혀져 부정확한 기준선이 채택되는 현상을 설명하며, 랜디 올슨과 제레미 잭슨의 Shifting Baselines Ocean Media Project를 통해 자연보전 정책에 널리 알려졌고, 마크 헨리는 '진보 주의력 결핍'이라는 용어로 긍정적인 변화의 과소평가에도 적용될 수 있도록 확장했다.
화학정보학 - 화학 데이터베이스
화학 데이터베이스는 화학 구조, 반응, 스펙트럼, 물성 등 화학 정보들을 디지털 형태로 저장 및 관리하는 시스템으로, 화학 물질 특성 규명, 신약 설계, 물질 검색 등에 활용되며 부분 구조 검색과 같은 기능도 제공한다.
화학정보학 - 가상 스크리닝
가상 스크리닝은 컴퓨터를 이용하여 신약 후보 물질을 발굴하는 방법으로, 리간드 기반, 구조 기반, 하이브리드 방법으로 나뉘며 계산량, 정확도, 필요한 계산 인프라 등에서 차이를 보인다.

민감도와 특이도

2. 정의

어떤 질병에 대한 검사를 평가하는 연구를 생각해 보자. 검사를 받는 각 사람은 질병이 있거나 없을 수 있다. 검사 결과는 양성(질병이 있다고 분류) 또는 음성(질병이 없다고 분류)일 수 있다. 각 사람에 대한 검사 결과는 실제 상태와 일치할 수도 있고 일치하지 않을 수도 있다. 이러한 상황에서 다음과 같은 경우가 있을 수 있다.

진양성: 아픈 사람을 아픈 사람으로 정확하게 식별
위양성: 건강한 사람을 아픈 사람으로 잘못 식별
진음성: 건강한 사람을 건강한 사람으로 정확하게 식별
위음성: 아픈 사람을 건강한 사람으로 잘못 식별

진양성, 위양성, 진음성, 위음성의 수를 구하면 검사의 민감도와 특이도를 계산할 수 있다. 민감도가 높으면 질병이 있는 사람이 양성으로 분류될 가능성이 높고, 특이도가 높으면 질병이 없는 사람이 음성으로 분류될 가능성이 높다. 미국 국립 보건원(NIH) 웹사이트에서 이러한 비율을 계산하는 방법을 설명하고 있다.^[3]

민감도는 질병이 있는 환자 중 검사가 환자를 올바르게 감지하는 능력을, 특이도는 질병이 없는 건강한 환자를 올바르게 식별하는 검사의 능력을 의미한다.

2. 1. 민감도 (Sensitivity, True Positive Rate, Recall)

민감도는 실제 양성인 대상 중에서 검사 결과가 양성으로 나타나는 비율을 의미한다. 즉, 질병이 있는 사람을 얼마나 잘 찾아내는지를 나타낸다.^[4] 민감도가 높다는 것은 질병이 있는 사람을 놓치지 않고 잘 찾아낸다는 의미이며, 위음성(False Negative) 오류가 낮다는 것을 뜻한다.

어떤 질병에 대한 검사의 민감도는 해당 질병을 가진 환자 중에서 검사가 양성으로 정확하게 판정하는 비율이다. 이를 수식으로 표현하면 다음과 같다.

: 민감도 = (진양성 수) / (진양성 수 + 위음성 수) = (진양성 수) / (모집단 내 모든 환자 수) = 환자가 질병을 앓고 있을 때 양성 검사 결과가 나올 확률

민감도가 높은 검사는 질병이 있는 사람을 거의 놓치지 않으므로, 검사 결과가 음성일 때 질병을 배제하는 데 유용하다.^[4] 민감도가 100%인 검사는 질병이 있는 모든 환자를 양성으로 판정하므로, 음성 결과는 환자에게 질병이 없음을 확실하게 나타낸다. 그러나 민감도가 높다고 해서 양성 결과가 반드시 질병을 확정하는 것은 아니다. 예를 들어, 항상 양성 판정을 내리는 가짜 검사는 민감도가 100%이지만, 위양성(건강한 사람을 아픈 사람으로 잘못 식별) 역시 100%이므로 질병을 진단하는 데는 쓸모가 없다.

민감도 계산에서는 불확실한 검사 결과는 고려되지 않는다. 만약 검사를 반복할 수 없는 경우, 불확실한 표본은 분석에서 제외하거나 위음성으로 처리해야 한다.

민감도가 높을수록 제2종 오류율은 낮아진다.

예를 들어, 질병이 있는 환자 100명을 검사하여 43명이 양성 반응을 보였다면, 검사의 민감도는 43%이다. 민감도는 유병률과 무관한 검사 특성이며, 검사 대상 집단의 질병 유병률에 영향을 받지 않는다.^[6]

2. 2. 특이도 (Specificity, True Negative Rate)

특이도는 질병이 없는 사람을 얼마나 정확하게 음성으로 판정하는지를 나타내는 지표이다. 다시 말해, 실제로 건강한 사람 중 검사 결과가 음성으로 나오는 비율을 의미한다. 특이도는 다음과 같이 계산할 수 있다.^[3]

:'''특이도 = 진음성 / (진음성 + 위양성)'''

여기서 '진음성'은 실제로 질병이 없는 사람이 검사 결과 음성으로 나온 경우를, '위양성'은 실제로 질병이 없는데 검사 결과 양성으로 나온 경우(제1종 오류)를 의미한다.

예를 들어, 어떤 질병이 없는 100명을 대상으로 검사를 진행했을 때 96명이 음성 판정을 받았다면, 이 검사의 특이도는 96%이다. 특이도가 높다는 것은 질병이 없는 사람을 양성으로 오진하는 경우가 적다는 것을 의미한다. 즉, 위양성 오류가 낮다는 것이다.^[5]

특이도가 높은 검사는 불필요한 격리나 치료를 줄이는 데 도움이 될 수 있다. 특이도가 100%인 검사는 질병이 없는 모든 사람을 음성으로 판정하기 때문에, 검사 결과가 양성으로 나오면 해당 질병이 있다고 확신할 수 있다.^[5] 하지만, 특이도가 높다고 해서 검사 결과가 음성일 때 질병이 없다고 단정할 수는 없다. 특이도는 질병이 있는 사람을 음성으로 잘못 판정하는 위음성 오류를 고려하지 않기 때문이다.^[5]

민감도와 특이도는 검사 자체의 특성을 나타내는 지표이며, 검사 대상 집단의 질병 유병률에 영향을 받지 않는다.^[6] 반면, 양성 예측도와 음성 예측도는 유병률의 영향을 받는다.

3. 선별 검사(Screening Study)에의 적용

어떤 질병에 대한 선별 검사를 평가하는 연구를 상상해 보자. 검사를 받는 사람들은 질병 유무에 따라 검사 결과가 양성(질병이 있다고 분류) 또는 음성(질병이 없다고 분류)으로 나올 수 있다. 검사 결과는 실제 상태와 일치하거나 일치하지 않을 수 있다.

진양성: 질병이 있는 사람을 질병이 있다고 정확하게 식별한다.
위양성: 질병이 없는 사람을 질병이 있다고 잘못 식별한다.
진음성: 질병이 없는 사람을 질병이 없다고 정확하게 식별한다.
위음성: 질병이 있는 사람을 질병이 없다고 잘못 식별한다.

진양성, 위양성, 진음성, 위음성의 수를 구하면 검사의 민감도와 특이도를 계산할 수 있다. 민감도가 높으면 질병이 있는 사람이 양성으로 분류될 가능성이 높고, 특이도가 높으면 질병이 없는 사람이 음성으로 분류될 가능성이 높다. 이러한 비율 계산 방법은 미국 국립 보건원(NIH) 웹사이트에서 확인할 수 있다.^[3]

3. 1. 진단 기준 설정과 민감도/특이도의 상충 관계 (Trade-off)

선별 검사에서는 진단 기준(Cut-off)을 어떻게 설정하느냐에 따라 민감도와 특이도가 달라진다. 일반적으로 진단 기준을 낮추면 민감도는 높아지지만 특이도는 낮아지고, 진단 기준을 높이면 특이도는 높아지지만 민감도는 낮아진다.

위의 두 그림에서 중간 실선은 검사 컷오프 지점을 나타낸다. 이 선을 이동하면 민감도와 특이도 수준 사이에 상충 관계가 발생한다. 선의 왼쪽은 컷오프 지점 아래의 데이터로 음성으로 간주된다. (파란색 점은 위음성(FN), 흰색 점은 진음성(TN)을 나타낸다.) 선의 오른쪽은 컷오프 지점 위의 데이터로 양성으로 간주된다. (빨간색 점은 위양성(FP)을 나타낸다.)

높은 민감도와 낮은 특이도를 보여주는 그림의 경우, 3개의 FN과 8개의 FP가 있다. 양성 결과 = 진양성(TP) + FP 이므로, TP = 40 - 8 = 32가 된다. 환자 수는 TP + FN, 즉 32 + 3 = 35와 같다. 따라서 민감도는 32 / 35 = 91.4%이다. 같은 방법으로 TN = 40 - 3 = 37을 얻고 건강한 사람의 수는 37 + 8 = 45가 되며, 이는 37 / 45 = 82.2%의 특이도를 나타낸다.

낮은 민감도와 높은 특이도를 보여주는 그림의 경우, 8개의 FN과 3개의 FP가 있다. 이전 그림과 같은 방법으로 TP = 40 - 3 = 37을 얻는다. 환자 수는 37 + 8 = 45이며, 이는 37 / 45 = 82.2%의 민감도를 제공한다. TN은 40 - 8 = 32 이다. 따라서 특이도는 32 / 35 = 91.4%가 된다.

100% 민감도를 가진 검사 결과에서 빨간색 점은 의학적 상태의 환자를 나타내며 빨간색 배경은 검사가 데이터 포인트를 양성으로 예측하는 영역을 나타낸다. 이 그림에서 진양성은 6개이고 거짓 음성은 0개이므로(모든 양성 상태가 양성으로 정확하게 예측되기 때문) 민감도는 100%이다.

100% 특이도를 가진 검사 결과에서 빨간색 점은 의학적 상태의 환자를 나타내지만 녹색 배경은 검사가 모든 환자가 의학적 상태가 없다고 예측한다는 것을 나타낸다. 그러면 진음성 데이터 포인트의 수는 26개이고 거짓 양성의 수는 0개이므로 특이도는 100%이다.

이처럼 민감도 또는 특이도만으로는 검사의 성능을 측정할 수 없다.

이러한 상충 관계는 수신자 조작 특성(Receiver Operating Characteristic, ROC) 곡선을 통해 시각적으로 표현할 수 있다. 최적의 진단 기준은 검사의 목적, 질병의 유병률, 위양성 및 위음성의 상대적 중요성 등을 고려하여 결정해야 한다.

4. 오해와 한계

민감도와 특이도는 검사 자체의 성능을 나타내는 지표이며, 검사 대상 집단의 질병 유병률(Prevalence)에 영향을 받지 않는다.^[6] 흔히 "매우 특이적인 검사는 양성일 때 질병을 확진하고, 매우 민감한 검사는 음성일 때 질병을 배제한다"는 오해가 있다.^[7]^[8] 이러한 주장은 SPPIN과 SNNOUT이라는 연상 기호로 널리 사용되는데, 매우 특이적인 검사는 양성일 때 질병을 확진(SP-P-IN)하고, 매우 민감한 검사는 음성일 때 질병을 배제(SN-N-OUT)한다는 것이다. 그러나 이는 유병률을 고려하지 않은 잘못된 해석이다. 실제 진단 상황에서는 민감도와 특이도 외에도 양성 예측도(Positive Predictive Value, PPV)와 음성 예측도(Negative Predictive Value, NPV)가 중요한데, 이 값들은 유병률에 따라 달라진다.^[9]^[10]^[11]

예를 들어, 항상 양성 판독을 내도록 설계된 '가짜' 검사 키트는 민감도가 100%이지만, 위양성률도 100%이므로 질병을 감지하거나 확진하는 데 쓸모가 없다. 반대로, 항상 음성 검사 결과를 반환하는 검사는 특이도가 100%이지만, 위음성을 고려하지 않기 때문에 질병을 배제하는 데 쓸모가 없다. SNNOUT 연상 기호는 검사 대상 샘플에서 해당 상태의 유병률이 극도로 낮을 때 어느 정도 타당성을 갖는다.

민감도 계산은 불확실한 검사 결과를 고려하지 않는다. 검사를 반복할 수 없는 경우, 불확실한 표본은 분석에서 제외하거나 가음성으로 처리할 수 있다(이 경우 민감도의 최악의 값을 제공하므로 과소평가될 수 있다).

특이도와 민감도 사이의 상충 관계는 ROC 분석에서 TPR과 FPR(즉, 재현율과 폴아웃) 사이의 상충 관계로서 탐구된다.^[12]

5. 정보 검색에서의 용어

정보 검색에서 양성 예측 값은 '''정밀도'''라고 하며, 민감도는 '''재현율'''이라고 한다.^[13]

F-점수는 양성 클래스에 대한 테스트의 단일 성능 척도로 사용될 수 있다. F-점수는 정밀도와 재현율의 조화 평균이다.

: $F = 2 \times \frac{\text{정밀도} \times \text{재현율}}{\text{정밀도} + \text{재현율}}$

6. 관련 통계 지표

민감도는 질병이 있는 환자 중에서 검사가 환자를 올바르게 감지하는 능력을 의미한다. 민감도가 높을수록 제2종 오류율이 낮다. 민감도는 다음 식으로 표현할 수 있다.^[4]

: $\begin{align}\text{민감도} & = \frac{\text{진양성자 수}}{\text{진양성자 수} + \text{가음성자 수}} \\[8pt]& = \frac{\text{진양성자 수}}{\text{모집단 내 모든 환자 수}} \\[8pt]& = \text{환자가 질병을 앓고 있다는 전제하에 양성 검사 결과가 나올 확률}\end{align}$

특이도는 질병이 없는 건강한 환자를 올바르게 식별하는 검사의 능력을 나타낸다. 특이도가 높은 검사는 제1종 오류율이 낮다.^[5] 특이도는 다음 식으로 표현할 수 있다.

: $\begin{align}\text{특이도} & = \frac{\text{진음성 수}}{\text{진음성 수} + \text{위양성 수}} \\[8pt]& = \frac{\text{진음성 수}}{\text{전체 집단에서 건강한 개인의 총 수}} \\[8pt]& = \text{환자가 건강할 때 음성 검사 결과가 나올 확률}\end{align}$

신호 탐지 이론에서 사용되는 통계치인 민감도 지수(''d′'')는 신호와 잡음 분포의 평균 사이의 분리를 잡음 분포의 표준 편차와 비교하여 제공한다.^[14] ''d′''는 무차원 통계치이며, ''d′''가 높을수록 신호를 더 쉽게 감지할 수 있음을 나타낸다.

민감도, 특이도 및 관련 용어 간의 관계는 오차 행렬을 통해 이해할 수 있다.

7. 추가 자료

Altman DG, Bland JM, ''Diagnostic tests. 1: Sensitivity and specificity'', BMJ, 308권, 6943호, 1552쪽, 1994년 6월.
Loong TW, ''Understanding sensitivity and specificity with the right side of the brain'', BMJ, 327권, 7417호, 716–9쪽, 2003년 9월.

참조

_[1] 논문 Statistical problems in assessing methods of medical diagnosis with special reference to x-ray techniques 1947
_[2] 논문 '[Sensitivity and specificity revisited: significance of the terms in analytic and diagnostic language].' https://pubmed.ncbi.[...]
_[3] 논문 Understanding and using sensitivity, specificity and predictive values 2008
_[4] 논문 Diagnostic tests. 1: Sensitivity and specificity 1994-06
_[5] 웹사이트 SpPin and SnNout https://www.cebm.ox.[...] Centre for Evidence Based Medicine (CEBM) 2023-01-18
_[6] 웹사이트 Diagnostic Reasoning I and II http://open.umich.ed[...] 2012-01-24
_[7] 웹사이트 Evidence-Based Diagnosis http://omerad.msu.ed[...] Michigan State University 2013-08-23
_[8] 웹사이트 Sensitivity and Specificity http://www.med.emory[...] Emory University Medical School Evidence Based Medicine course
_[9] 논문 Too bad it isn't true 1994-04
_[10] 논문 Ruling out or ruling in disease with the most sensitive or specific diagnostic test: short cut or wrong turn? 1994-04
_[11] 논문 Ruling a diagnosis in or out with "SpPIn" and "SnNOut": a note of caution 2004-07
_[12] 논문 An Introduction to ROC Analysis 2006
_[13] 논문 Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation https://www.research[...] 2011
_[14] 논문 A basal ganglia pathway drives selective auditory responses in songbird dopaminergic neurons via disinhibition 2010-01
_[15] 서적 Detection Theory: A User's Guide https://books.google[...] Psychology Press 2004-09-15
_[16] 웹사이트 Diagnostic test online calculator calculates sensitivity, specificity, likelihood ratios and predictive values from a 2x2 table – calculator of confidence intervals for predictive parameters http://www.medcalc.o[...]
_[17] 논문 Prediction of complete gene structures in human genomic DNA https://ai.stanford.[...]
_[18] 논문 GeneMark-ES https://academic.oup[...] 2005
_[19] 논문 Gene finding in novel genomes 2004
_[20] 논문 A beginner's guide to eukaryotic genome annotation 2012-04
_[21] 논문 Statistical problems in assessing methods of medical diagnosis with special reference to x-ray techniques 1947

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com